当前位置: 开发笔记 > 编程语言 > 正文

声道|下文_音视频开发9.使用ffmpeg将pcm转码mp3实践(C++)

作者：佩弦_秦子轩_188 | 来源：互联网 | 2023-09-11 11:28

篇首语：本文由编程笔记#小编为大家整理，主要介绍了音视频开发9.使用ffmpeg将pcm转码mp3实践(C++)相关的知识，希望对你有一定的参考价值。@[TO

篇首语：本文由编程笔记#小编为大家整理，主要介绍了音视频开发9. 使用ffmpeg 将pcm转码mp3实践(C++)相关的知识，希望对你有一定的参考价值。

&＃64;[TOC](音视频开发9. 使用ffmpeg 将pcm转码mp3实践(C&＃43;&＃43;))

一、准备环境

CentOS环境
安装 ffmpeg 库&＃xff0c;并有必要的库&＃xff08;主要是lame:mp3解码库&＃xff09;
ffmpeg库安装可参考之前文档

二、一些预备知识

1. 音频格式说明

如前文所述&＃xff0c;pcm是音频裸数据&＃xff0c;要转成mp3需要进行重采样、编码步骤。常见的PCM格式有8位和16位两种。

8位每一个PCM数据的值由一个字节即8位来表示(0-255)
16位是指每一个PCM数据的值由两个字节即16位来表示&＃xff0c;分为高8位和第8位(-32767~32767)

2. 采样频率

采样频率指每秒钟对音频的采样点数&＃xff0c;单位为Hz(赫兹)。
如采样频率为44100hz是指每秒钟采集44100个样本点。

3. 声道数

常见的声道数有:

单声道:mono
双声道:stereo,包含左右两声道
2.1声道:在双声道基础上增加了一个低音声道
5.1声道:分别为正面、左前方、右前方、左环绕、右环绕声道、一个低音声道
7.1声道:在5.1声道的基础上&＃xff0c;把左右的环绕声道拆分为左右环绕声道以及左右后置声道&＃xff0c;主要应用于BD以及现代的电影院

4. 样本大小

例&＃xff1a;

1024个16位单声道PCM样本&＃xff0c;它的样本大小为102421&＃61;2048字节&＃xff1b;
1024个16位双声道PCM样本&＃xff0c;它的样本大小为102422&＃61;4096字节

5. 一帧样本数

PCM 一般为1024&＃xff1b;
MP3 一般为 1152。

6. 参考命令行

ffmpeg -y -ac 1 -ar 16000 -f s16le -i /data/ffmpeg/test/input.pcm -c:a libmp3lame -q:a 2 /data/ffmpeg/test/output.mp3
三、几个重要函数

1. 重采样参数设置两个函数

3.1.1 swr_alloc_set_opts

示例:

SwrContext* swrContext &＃61; NULL; // 设置参数&＃xff0c; 1. 重采样上下文 2.输出声道布局 4.输出采样率, 5.输入声道布局 6.输入样本格式 7.输入采样率 8.配音 9.日志 swrContext &＃61; swr_alloc_set_opts(swrContext, avCodecContext->channel_layout, avCodecContext->sample_fmt, avCodecContext->sample_rate, AV_CH_LAYOUT_STEREO, AV_SAMPLE_FMT_S16, 44100, 0, 0);

3.1.2 av_opt_set_int

示例&＃xff1a;

SwrContext *swrContext &＃61; swr_alloc(); // 通道布局:立体声 av_opt_set_int(swrContext, "in_channel_layout", AV_CH_LAYOUT_STEREO, 0); // 采样率:44100 av_opt_set_int(swrContext, "in_sample_rate", OSR, 0); // 样本格式 s16交错存储 av_opt_set_sample_fmt(swrContext, "in_sample_fmt", AV_SAMPLE_FMT_S16, 0);

在设置完参数后&＃xff0c;要调用swr_init进行初始化。

2. 分配样本数据内存空间

3.2.1 av_samples_alloc_array_and_samples

根据音频格式分配相应大小的内存空间&＃xff0c;函数内部会调用 av_samples_alloc &＃xff0c;示例代码&＃xff1a;

result &＃61; av_samples_alloc_array_and_samples(&input_data, &input_linesize, 2, avFrame->nb_samples, AV_SAMPLE_FMT_S16, 0);

3.2.2 av_samples_alloc

根据音频格式分配相应大小的内存空间。用于转换过程中对输出内存大小进行调整。

3. 整体流程

四、实现代码

1. CMakeLists.txt

cmake_minimum_required(VERSION 3.17) project(ffmpeg_demo) # 设置ffmpeg依赖库及头文件所在目录&＃xff0c;并存进指定变量 set(ffmpeg_libs_DIR /home/xundh/ffmpeg_sources/ffmpeg-4.2.2) set(ffmpeg_headers_DIR /home/xundh/ffmpeg_sources/ffmpeg-4.2.2) #对于find_package找不到的外部依赖库&＃xff0c;可以用add_library添加 # SHARED表示添加的是动态库 # IMPORTED表示是引入已经存在的动态库 add_library( avcodec SHARED IMPORTED) add_library( avfilter SHARED IMPORTED ) add_library( swresample SHARED IMPORTED ) add_library( swscale SHARED IMPORTED ) add_library( avformat SHARED IMPORTED ) add_library( avutil SHARED IMPORTED ) #指定所添加依赖库的导入路径 set_target_properties( avcodec PROPERTIES IMPORTED_LOCATION $ffmpeg_libs_DIR/libavcodec/libavcodec.so ) set_target_properties( avfilter PROPERTIES IMPORTED_LOCATION $ffmpeg_libs_DIR/libavfilter/libavfilter.so ) set_target_properties( swresample PROPERTIES IMPORTED_LOCATION $ffmpeg_libs_DIR/libswresample/libswresample.so ) set_target_properties( swscale PROPERTIES IMPORTED_LOCATION $ffmpeg_libs_DIR/libswscale/libswscale.so ) set_target_properties( avformat PROPERTIES IMPORTED_LOCATION $ffmpeg_libs_DIR/libavformat/libavformat.so ) set_target_properties( avutil PROPERTIES IMPORTED_LOCATION $ffmpeg_libs_DIR/libavutil/libavutil.so ) # 添加头文件路径到编译器的头文件搜索路径下&＃xff0c;多个路径以空格分隔 include_directories( $ffmpeg_headers_DIR ) link_directories($ffmpeg_libs_DIR ) link_directories(/usr/lib) set(CMAKE_CXX_STANDARD 14) # add_executable(ffmpeg_demo main.cpp) add_executable(ffmpeg_demo pcm_to_mp3.cpp) target_link_libraries($PROJECT_NAME avcodec avformat avutil swresample swscale swscale avfilter )

2. 主文件

#include <iostream> #ifdef __cplusplus extern "C" #endif #include "libavcodec/avcodec.h" #include "libavformat/avformat.h" #include "libavutil/imgutils.h" #include "libavutil/log.h" #include "libswresample/swresample.h" #include "libavutil/avutil.h" #include "libavutil/opt.h" #ifdef __cplusplus #endif using namespace std; #define CHANNEL 2 #define OSR 44100 /** * pcm 转 mp3格式,输入文件路径 */ int pcm_to_mp3(const char *pcm_file_path, const char *mp3_file_path) FILE *pcm_file &＃61; NULL; FILE *mp3_file &＃61; NULL; int result; // 获取mp3编码器 cout << "获取mp3编码器" << endl; const AVCodec *avCodec &＃61; avcodec_find_encoder(AV_CODEC_ID_MP3); if (!avCodec) cout << "初始化mp3 编码器失败" << endl; return -1; // 创建编码器上下文 AVCodecContext *avCodecContext &＃61; avcodec_alloc_context3(avCodec); if (!avCodecContext) cout << "avcodec_alloc_context3 失败" << avCodecContext << endl; return -1; avCodecContext->bit_rate &＃61; 64000; avCodecContext->channels &＃61; CHANNEL; avCodecContext->channel_layout &＃61; AV_CH_LAYOUT_STEREO; avCodecContext->sample_rate &＃61; OSR; avCodecContext->sample_fmt &＃61; AV_SAMPLE_FMT_S16P; avCodecContext->time_base &＃61; av_get_time_base_q(); // 打开编码器 cout << "打开mp3编码器" << endl; result &＃61; avcodec_open2(avCodecContext, avCodec, NULL); if (result < 0) cout << "avcodec_open2失败: " << result << endl; return result; cout << "打开mp3文件" << mp3_file_path << endl; // 打开输出文件 mp3_file &＃61; fopen(mp3_file_path, "wb"); if (!mp3_file) cout << "打开mp3文件失败" << endl; return -1; // AVFrame 接受重采样的每一帧的音频数据每帧的样本大小为1152 AVFrame *avFrame &＃61; av_frame_alloc(); if (!avFrame) cout << "分配avFrame帧失败" << endl; return -1; // mp3一帧的样本数为1152 avFrame->nb_samples &＃61; 1152; avFrame->channels &＃61; CHANNEL; avFrame->channel_layout &＃61; AV_CH_LAYOUT_STEREO; avFrame->format &＃61; AV_SAMPLE_FMT_S16P; // 给帧分配内存空间 result &＃61; av_frame_get_buffer(avFrame, 0); if (result < 0) cout << "分配帧内存失败" << endl; return result; // 重采样创建音频重采样上下文 cout << "配置重采样器上下文" << endl; SwrContext *swrContext &＃61; swr_alloc(); if (!swrContext) cout << "配置重采样上下文失败" << endl; return -1; // 设置重采样输入pcm参数:通道布局:立体声采样率:44100 样本格式 s16交错存储 av_opt_set_int(swrContext, "in_channel_layout", AV_CH_LAYOUT_STEREO, 0); av_opt_set_int(swrContext, "in_sample_rate", OSR, 0); av_opt_set_sample_fmt(swrContext, "in_sample_fmt", AV_SAMPLE_FMT_S16, 0); // 设置重采样输出mp3参数:通道布局:立体声采样率:44100 样本格式 s16平面存储 av_opt_set_int(swrContext, "out_channel_layout", AV_CH_LAYOUT_STEREO, 0); av_opt_set_int(swrContext, "out_sample_rate", OSR, 0); av_opt_set_sample_fmt(swrContext, "out_sample_fmt", AV_SAMPLE_FMT_S16P, 0); // 重采样初始化 result &＃61; swr_init(swrContext); if (result < 0) cout << "重采样器初始化失败,error&＃61;" << result << endl; return result; uint8_t **input_data &＃61; NULL; uint8_t **output_data &＃61; NULL; int input_linesize, output_linesize; // 打开pcm文件 cout << "打开源 pcm 文件 " << pcm_file_path << endl; pcm_file &＃61; fopen(pcm_file_path, "rb"); if (!pcm_file) cout << "打开 pcm 文件失败" << endl; return -1; cout << "开始编码转换" << endl; // 给pcm文件数据分配空间 result &＃61; av_samples_alloc_array_and_samples(&input_data, &input_linesize, 2, avFrame->nb_samples, AV_SAMPLE_FMT_S16, 0); if (result < 0) cout << "给pcm文件分配空间失败, result &＃61; " << result << endl; return result; // 缓存重采样数据的空间分配 result &＃61; av_samples_alloc_array_and_samples(&output_data, &output_linesize, 2, avFrame->nb_samples, AV_SAMPLE_FMT_S16P, 0); if (result < 0) cout << "获取mp3 重采样数据失败, result&＃61;" << result << endl; return result; // 存放编码后的数据 AVPacket *avPacket &＃61; av_packet_alloc(); if (!avPacket) cout << "分配 avPacket 内存失败" << endl; return -1; cout << "&＃61;&＃61;&＃61;&＃61;&＃61;&＃61;&＃61;&＃61;&＃61;&＃61;循环读入帧&＃61;&＃61;&＃61;&＃61;&＃61;&＃61;&＃61;&＃61;&＃61;&＃61;" << endl; long total_size &＃61; 0; while (!feof(pcm_file)) long read_size &＃61; (long)fread(input_data[0], 1, avFrame->nb_samples * 4, pcm_file); total_size &＃43;&＃61; read_size; if ((total_size / read_size) % 50 &＃61;&＃61; 0) cout << "读取数据:" << read_size << "字节; 累计:" << total_size << " 字节 " << endl; if (read_size <&＃61; 0) break; // 重采样 result &＃61; swr_convert(swrContext, output_data, avFrame->nb_samples, (const uint8_t **)input_data, avFrame->nb_samples); if (result < 0) cout << "音频编码失败,错误信息" << result << endl; return result; // 将重采样后的数据存入frame&＃xff0c;MP3是s16p 先存放左声道的数据后存放右声道的数据&＃xff0c; data[0]是左声道&＃xff0c;1是右声道 avFrame->data[0] &＃61; output_data[0]; avFrame->data[1] &＃61; output_data[1]; // 编码&＃xff0c;写入mp3文件&＃xff0c;实际上是对frame这个结构体里面的数据进行编码操作,发送到编码线程:使用编码器和存储数据的frame result &＃61; avcodec_send_frame(avCodecContext, avFrame); if (result < 0) cout << "mp3编码失败,错误信息:" << result << endl; return result; while (result >&＃61; 0) // 接收编码后的数据&＃xff0c;使用编码器和存储编码数据的pkt, 有可能需要多次才能接收完成 result &＃61; avcodec_receive_packet(avCodecContext, avPacket); // AVERROR_EOF表示没有数据了这两个错误不影响继续接收数据 if (result &＃61;&＃61; AVERROR_EOF || result &＃61;&＃61; AVERROR(EAGAIN)) continue; else if (result < 0) break; fwrite(avPacket->data, 1, avPacket->size, mp3_file); av_packet_unref(avPacket); // 告诉解码器没有帧了,如果没有这几行的逻辑&＃xff0c;在关闭 avCodecContext 可能会提示 * fames left in the queu on closing avcodec_send_frame(avCodecContext, __null); while(avcodec_receive_packet(avCodecContext, avPacket)!&＃61;AVERROR_EOF); // 关闭缓存 if (input_data) av_free(input_data); if (output_data) av_free(output_data); cout << "关闭文件" << endl; fclose(pcm_file); fclose(mp3_file); cout << "释放资源" << endl; // s释放 frame pkt av_frame_free(&avFrame); av_packet_free(&avPacket); // 释放重采样上下文 swr_free(&swrContext); // 释放编码器上下文 avcodec_free_context(&avCodecContext); cout << "转码完成" << endl; return 0; int main(int argc, char *argv[]) const char *input &＃61; "input.pcm"; const char *output &＃61; "out.mp3"; pcm_to_mp3(input, output); return 1;

程序执行结果&＃xff1a;

./ffmpeg_demo 获取mp3编码器打开mp3编码器打开mp3文件out.mp3 配置重采样器上下文打开源 pcm 文件 input.pcm 开始编码转换 &＃61;&＃61;&＃61;&＃61;&＃61;&＃61;&＃61;&＃61;&＃61;&＃61;循环读入帧&＃61;&＃61;&＃61;&＃61;&＃61;&＃61;&＃61;&＃61;&＃61;&＃61; 读取数据:4608字节; 累计:230400 字节读取数据:4608字节; 累计:460800 字节读取数据:4608字节; 累计:691200 字节读取数据:4608字节; 累计:921600 字节关闭文件释放资源转码完成

推荐阅读

io
Yii2 GridView 实现列表页数据直接编辑的完整指南

本文详细介绍了如何使用 Yii2 的 GridView 组件在列表页面实现数据的直接编辑功能。通过具体的代码示例和步骤，帮助开发者快速掌握这一实用技巧。 ... [详细]

蜡笔小新 2024-12-27 16:27:52
settings
编写有趣的VBScript恶作剧脚本

本文将介绍如何编写一些有趣的VBScript脚本，这些脚本可以在朋友之间进行无害的恶作剧。通过简单的代码示例，帮助您了解VBScript的基本语法和功能。 ... [详细]

蜡笔小新 2024-12-28 09:46:23
io
XNA 3.0 游戏编程：从 XML 文件加载数据

本文介绍如何在 XNA 3.0 游戏项目中从 XML 文件加载数据。我们将探讨如何将 XML 数据序列化为二进制文件，并通过内容管道加载到游戏中。此外，还会涉及自定义类型读取器和写入器的实现。 ... [详细]

蜡笔小新 2024-12-27 11:39:44
main
深入理解Python的os和sys模块

本文详细解析了Python中的os和sys模块，介绍了它们的功能、常用方法及其在实际编程中的应用。 ... [详细]

蜡笔小新 2024-12-26 22:04:19
io
优化ListView性能

本文深入探讨了如何通过多种技术手段优化ListView的性能，包括视图复用、ViewHolder模式、分批加载数据、图片优化及内存管理等。这些方法能够显著提升应用的响应速度和用户体验。 ... [详细]

蜡笔小新 2024-12-28 10:36:30
main
Python 的 10 个开发技巧！太实用了

1.如何在运行状态查看源代码？查看函数的源代码，我们通常会使用IDE来完成。比如在PyCharm中，你可以Ctrl+鼠标点击进入函数的源代码。那如果没有IDE呢？当我们想使用一个函 ... [详细]

蜡笔小新 2024-12-27 18:36:54
io
JQuery基础：省市联动与表单验证

本文介绍了如何使用JQuery实现省市二级联动和表单验证。首先，通过change事件监听用户选择的省份，并动态加载对应的城市列表。其次，详细讲解了使用Validation插件进行表单验证的方法，包括内置规则、自定义规则及实时验证功能。 ... [详细]

蜡笔小新 2024-12-27 17:10:48
io
Java 序列化接口详解

本文深入探讨了 Java 中的 Serializable 接口，解释了其实现机制、用途及注意事项，帮助开发者更好地理解和使用序列化功能。 ... [详细]

蜡笔小新 2024-12-27 15:06:12
io
Akka BackoffSupervisor的深入解析与实践

本文详细介绍了Akka中的BackoffSupervisor机制，探讨其在处理持久化失败和Actor重启时的应用。通过具体示例，展示了如何配置和使用BackoffSupervisor以实现更细粒度的异常处理。 ... [详细]

蜡笔小新 2024-12-27 15:04:09
io
Python自动化处理：从Word文档提取内容并生成带水印的PDF

本文介绍如何利用Python实现从特定网站下载Word文档，去除水印并添加自定义水印，最终将文档转换为PDF格式。该方法适用于批量处理和自动化需求。 ... [详细]

蜡笔小新 2024-12-27 13:10:20
io
Hadoop入门与核心组件详解

本文详细介绍了Hadoop的基础知识及其核心组件，包括HDFS、MapReduce和YARN。通过本文，读者可以全面了解Hadoop的生态系统及应用场景。 ... [详细]

蜡笔小新 2024-12-26 13:12:48
io
HDFS与Hive中的数据存储和管理机制

本文探讨了Hive中内部表和外部表的区别及其在HDFS上的路径映射，详细解释了两者的创建、加载及删除操作，并提供了查看表详细信息的方法。通过对比这两种表类型，帮助读者理解如何更好地管理和保护数据。 ... [详细]

蜡笔小新 2024-12-27 20:21:48
main
使用 Azure Service Principal 和 Microsoft Graph API 获取 AAD 用户列表

本文介绍了一段通用代码示例，该代码不仅能够操作 Azure Active Directory (AAD)，还可以通过 Azure Service Principal 的授权访问和管理 Azure 订阅资源。Azure 的架构可以分为两个层级：AAD 和 Subscription。 ... [详细]

蜡笔小新 2024-12-27 16:07:12
main
从 .NET 转 Java 的自学之路：IO 流基础篇

本文详细介绍了 Java 中的 IO 流，包括字节流和字符流的基本概念及其操作方式。探讨了如何处理不同类型的文件数据，并结合编码机制确保字符数据的正确读写。同时，文中还涵盖了装饰设计模式的应用，以及多种常见的 IO 操作实例。 ... [详细]

蜡笔小新 2024-12-26 17:37:25
io
高效解决应用崩溃问题！友盟新版错误分析工具全面升级

友盟推出的最新版错误分析工具，专为移动开发者设计，提供强大的Crash收集与分析功能。该工具能够实时监控App运行状态，快速发现并修复错误，显著提升应用的稳定性和用户体验。 ... [详细]

蜡笔小新 2024-12-26 14:11:47

佩弦_秦子轩_188

这个家伙很懒，什么也没留下！

Tags | 热门标签

RankList | 热门文章